高分文章RIP-seq和m6A峰图可视化两种方法-IGV和UCSC | m6A专题
老师一定觉得做完了RIP-seq、ATAC-seq、m6A-seq等项目,相对基因的某个区域高富集区域绘制peak calling的图,类似于下面展示的几种形式,当然这里的AI不是人工智能的意思,而是Adobe Illustrator的简称。
那么这种图是怎么得到的呢?目前有两种方法可以得到——bedtools和IGV都可以做出类似的图,bedtools操作较为复杂需要linux环境,而IGV则有桌面版软件。下面我们就来看看如何实现论文级别的矢量图。
第一步,去网上下载IGV软件,下载地址为http://software.broadinstitute.org/software/igv/download ,然后在文件夹IGV_Win_2.4.16/lib 下打开igv.jar(事先要安装JAVA8版本,JAVA9以上版本不能用),看到以下界面后,我们首选选择基因组信息,以本实验为例我们选择hg38版的人基因组信息。
我们从网上已公布的m6A测序结果中,选取中其中2个样本作为示例,挑选的基因为MT2A中某个转录本MT2A-201,这个转录本只有3个外显子,以便于老师理解。我们输入chr16:56,608,199-56,609,497作为想要查看的染色体区域信息输入进去后,变成了该区域的情况。我们可以看到在最下方,还出现了MT2A的2个外显子的结构。
第二步,输入每个样本的reads的mapping文件,文件以tdf、bigwig/bw、bedgraph等格式结尾。这些文件格式可以让公司专门为老师生成,老师只需要把该基因在染色体上的区域如chr16:56,608,199-56,609,497告诉我们即可,我们会为老师生成每个样本的相应格式文件了。我们拿到公司的这些格式后就可以导入到IGV了。
当然,这边想要自己操作的话,联川生物也提供了一些示例文件给大家。大家可以按照百度网盘的地址链接: https://pan.baidu.com/s/1e98FluMxu_64mIo2cx7iVw 提取码: qic6 ,或按照上图的小程序码直接打开百度网盘下载demo示例文件,进行测试。我们提供了ALKBH5_1和control总计2个样本4个文件,分别是2个Input和2个IP,且为两个不同的格式。
如果自己有linux运行环境的老师,或者正在学习的生信的朋友们,你们也可以自行根据bam文件生产tdf、bw等各种IGV软件支持的格式文件。
我们以tdf文件示例(当然bw以及bedgraph格式也是可以的),导入AY和B2L这两个样本进入IGV进行可视化。基因组信息,这边由于示例样本为human的hg38版本,其他物种请自行选择从在线数据或本地导入基因组信息。
如上图所示,这就是4个文库在chr16上特定区域里 reads的覆盖情况,我们可以发现某些区域reads覆盖度特别高,而有些区域几乎为0。但是这个颜色实在是太丑了!我们要对颜色进行替换。
单击右键的Change Track Color一栏,点开后我们把蓝色换成少女心爆棚的粉红色。这样子我们会看到背景色从蓝色变成了粉红色。
最后我们要从IGV导出图片,可不能直接用QQ截图Ctrl+Alt+A那种,而是要导出矢量图。什么叫矢量图,就是你无限放大后图片依然有很高的清晰度。所以我们选择了SVG格式。
即使SVG是矢量图,也无法得到我们想要的编辑格式。这时候我们需要先安装一个软件Adobe Acrobat。安装好Acrobat之后,我们用360网页浏览器打开SVG格式的文件作为示范。
从上图可以得知,在网页任意处点击右键,选择“打印”一栏。我们选择打印并非是真正要从打印机上打印,而是用PDF格式文件存起来。而输出的PDF格式文件里的各种元素,就是我们所说的矢量图必备。
需要注意的是在左侧需要对打印PDF文件一些参数和细节做一些调整。如本次例子所示,我们选择了A2纸大小,彩色等选项,并且可以在右侧预览打印效果。如果纸张过小很有可能会导致打印内容不全。最后我们就能愉快地输出PDF文档了。
打开PDF文档,推荐使用Adobe Acrobat,因为这款软件是在Adobe Reader的基础上可以修改PDF文档里的各种元素。如上面第一张图所示,刚才IGV内所显示的内容全部呈现在面前。但是请注意,这个图如果你按住快捷键Ctrl+鼠标滚轮,你可以无限放大和缩小,你会发现几乎不存在低像素的问题,而都是高清的元素。这就是我们前面讲到的矢量图。所以上面第二张图我们放大到400%后,你会发现里面的元素依旧很清晰!
这时候我们需要请出Adobe家族的另一款软件Adobe Illustrator,简称AI。在用AI打开这个PDF文件后,我们开始对多余元素进行删除。这里介绍几个Adobe AI软件的常用快捷键,Ctrl+鼠标滚轮就是左右移动画布,Alt+鼠标滚轮就是画布放大缩小,鼠标滚轮就是画布上下移动。
在打开PDF文档后,我们单独保存了一个.ai文件。而不同的修改方案,建议同时保存几套.ai文件以备不时之需。由于打开的图形如上图所示,是竖着的。
下一步就是要按住ctrl+A选中所有元素后,单击右键变换→旋转,选择270°即可。
调整好方向后,我就要对多余的元素进行删除,之前我们还要调整下画布的大小,在左侧工具栏点击
上图就是各种元素删除后剩下的。这里添加一些自己感兴趣的元素,或者给已有的元素修改下颜色,或修改透明度。
这里推荐大家一本书,叫《生命科学插图从入门到精通——Adobe Illustrator使用技巧》,里面会告诉大家如何做出精美的无损论文插图。
我们继续在里面添加了一些文字和元素,当然这里只用了复制元素、添加文字和修改颜色等极少部分功能,更强大的功能还是请老师阅读《生命科学插图从入门到精通——Adobe Illustrator使用技巧》。
最后我们要输出矢量图的格式(PDF),可以在最上面的菜单栏单击文件→存储副本,保存为PDF格式即可。那么有老师会问了,我把这些图片导入到PPT里可不可以。我们的答案是可以,但是PPT再导出的图片就不是矢量图了,如果无限放大我们会发现图片的像素会越来越模糊。
另外有一个小技巧就是Nature和Cell杂志大部分图都为矢量图,我们可以用AI或者Acrobat软件把里面好的元素抠出来,做一些颜色的调整和形状转换,也可以放入自己的论文中增加亮点。
我们登陆ucsc官网(https://genome-asia.ucsc.edu/ )后选择对应的基因组版本和想要查看的基因名称。除了人、小鼠等模式生物外,诸如拟南芥等模式植物也被UCSC官网收录了。
界面主要区域分为两大块:展示的窗口界面和Track控制界面。调整track的“隐藏”、“压缩显示”、“全显示”等属性,以改变其在展示界面对应的展示情况
你会问:上面展示界面中的信息这么多,好乱啊,分都分不清……那么,请把鼠标移动到展示界面的最左侧,他会高亮显示当前track包括哪一部分的内容(下图绿色),并且显示一个小文本框,说明你这个当前track的名字,然后你不想要它显示了,可以右键选择(或者拉到页面下面的track部分),把对应的track属性选为“hide”即可。如果是下拉到track部分,选择后不要忘记“refrash”!
选择当前track的最左侧灰色条:直接使用鼠标拖拽它,改变和其他track的上下顺序;右键可展示和修改展示属性;直接点击,可以查看这个track一些详细的配置和了解这个track的详细说明信息。
导入我们要展示的信息:一般都是比对结果,展示丰度情况。
一般来说,如果有类似一些已经上传到ftp或者数据库等的数据的网址信息,特别是一些比较大的数据,一般需要一个web-accessible locations。如果使用上传的地址信息,可以直接用于上传UCSC Genome Browser,会比较方便——track Hubs。如果没有,可以参看对应的说明,针对需要展示的数据查看具体的上传方式——add custom tracks。bigBed, bigWig, bigGenePred, BAM and VCF文件的展示,一定要有一个web-accessible data storage(在线存储网站)。
可以使用deeptools产生的bigwig(bw)文件,但是bigwig文件一定要上传之后获取网址。可以尝试上传,具体方式可以参考UCSC的推荐(https://genome-asia.ucsc.edu/goldenPath/help/hgTrackHubHelp.html#Hosting )。如果涉及到数据的保密等问题,可以尝试私有ftp设置外链接。这里我们推荐名为CYVERSE数据库https://de.cyverse.org/de/ 。
从上图中我们可以看到,当你注册完了CyVerse账号后,就可以将bigwig、bedGraph等格式进行上传,并生成能够直接被UCSC识别的超级链接地址。
可以改变deeptools的输出文件格式,可以使用outFileFormat为bedGraph形式,然后如果整个bedGraph文件过大,上传过慢,可以截取出关注基因或者关注区域的bedGraph文件,进行上传。
上传的bedGraph文件,在开头需要添加一列track line信息,生命文件格式、track name等。例如:track type=bedGraph name=DEMO color=0,128,0 visibility=full priority=20。
接下来我们上传了bedGraph格式用于测试的demo文件,在前面IGV已经提供了,这边尽量选择bedgraph结尾的文件的ALKBH5_1样本。如需要根据自己的样本生成,可以联系联川的售后人员来协助您。
如果还需要上传更多的track,基本上可以理论上不停添加。然后点击右侧的GO按钮。
前面的,基本可以满足需求了,美观的话就靠自己调整了。接下来讲,track叠加……
然后就是修改new collection track的名称,叠加的单track的颜色等。
隐藏掉不要的track,调整好之后,可以存成pdf矢量图哦!
西北农林马闯组m6A/m5C/Ψ整合分析流程登顶Plant Physiol | m6A专题
重磅发布:RNA修饰变异在线数据库RMVar | m6A专题
干货分享| 普林斯顿教授详谈RNA与蛋白质互作高通量检测技术 | m6A专题&RIP专题
所见即所得,figure有bi格
联川云平台,让科研更自由